ROLL x Ascend
Last updated: 11/25/2025.
我们在 ROLL 上增加对华为昇腾设备的支持。
硬件支持
Atlas 900 A2 PODc
安装
基础环境准备
| software | version |
|---|---|
| Python | 3.11 |
| CANN | 8.3.RC1 |
创建 conda 环境
使用以下命令在 Miniconda 中创建新的 conda 环境:
conda create --name roll python=3.11
conda activate roll
安装 torch & torch_npu:
为了能在 ROLL 中正常使用 torch 和 torch_npu,需使用以下命令安装 torch 和 torch_npu。
# 安装 torch 的 CPU 版本
pip install torch==2.7.1 torchvision==0.22.1 torchaudio==2.7.1 --index-url https://download.pytorch.org/whl/cpu
# 安装 torch_npu
pip install torch_npu==2.7.1
安装vllm & vllm-ascend:
为了能够在 ROLL 中正常使用 vllm,需使用以下命令编译安装 vllm 和 vllm-ascend。
# vllm
git clone -b v0.11.0 --depth 1 https://github.com/vllm-project/vllm.git
cd vllm
pip install -r requirements/build.txt
VLLM_TARGET_DEVICE=empty pip install -v -e .
cd ..
# vllm-ascend
git clone -b v0.11.0rc1 --depth 1 https://github.com/vllm-project/vllm-ascend.git
cd vllm-ascend
pip install -e .
cd ..
或者可以从预编译的 wheel 包安装 vllm 和 vllm-ascend:
# Install vllm-project/vllm. The newest supported version is v0.11.0.
pip install vllm==0.11.0
# Install vllm-project/vllm-ascend from pypi.
pip install vllm-ascend==0.11.0rc1
安装 ROLL
git clone https://github.com/alibaba/ROLL.git
cd ROLL
pip install -r requirements_common.txt
pip install deepspeed==0.16.4
cd ..
其他三方库说明
| software | description |
|---|---|
| transformers | >= v4.57.1 |
| flash_attn | not supported |
| transformer-engine[pytorch] | not supported |
- 支持通过 transformers 使能 --flash_attention_2, transformers 需大于等于 4.57.1 版本。